“怎么學會的?工作當中一點一點學的。”近日,在科大訊飛阿拉伯語人工智能產(chǎn)業(yè)基地,新晉人工智能訓練師馬冰潔坦言。畢業(yè)于寧夏大學阿拉伯語專業(yè)的她,從未想過自己會與代碼打交道。
上班期間,她面對的是一張阿拉伯語菜單圖片——AI模型把它識別得一塌糊涂。如何讓這個不聽話的“學生”準確認出這些文字?這是她每天都要做的工作。
“我們要盡量站在模型的角度去思考問題,”一旁的資深人工智能訓練師吳梅群解釋道,“說起來有點矛盾,我們希望模型跟上人類的思維,但實際操作時,卻要求自己‘反思維化’,去遵循模型的邏輯。”
吳梅群把AI模型看作一個對世界抱有“刻板印象”的學生:“我喂給它什么數(shù)據(jù),它就形成什么樣的認知。”目前,她們參與的多語種OCR項目主攻阿拉伯語。那些來自街景、菜單、合同的圖片或文檔,需要經(jīng)過代碼附上描述,再“喂”給大模型。只有把這些數(shù)據(jù)轉(zhuǎn)化為AI能理解的“養(yǎng)料”,后續(xù)的翻譯機等產(chǎn)品才能精準運轉(zhuǎn)。
日復一日面對AI“簡單”而重復的思維,如何保持耐心與專注,成為她們必須面對的挑戰(zhàn)。
“我們會想辦法從工作中找到樂趣,”吳梅群說。她曾在公司全球1024開發(fā)者節(jié)上,看到家長和孩子們對阿爾法蛋機器人充滿好奇;她日常使用星火大模型時,總會想到其中也有自己填充的數(shù)據(jù);更讓她感到踏實的是,她知道經(jīng)手處理的教育數(shù)據(jù)正用于學習機,標注的多語種信息也支撐著翻譯筆與大模型。
“在看到落地的產(chǎn)品,真的有人在用的時候,我會覺得我的投入都很值得。”吳梅群說。
她感慨,這份職業(yè),聽起來高大上,實則非常接地氣。她們每天用智慧與耐心,在數(shù)據(jù)的海洋中為AI指引方向,讓它逐漸聽懂人話,理解世界。她們是技術的“陪跑者”,更是人機協(xié)作的“搭建者”。在她們手中,冰冷的代碼與數(shù)據(jù),正一點點被賦予溫度與智能,最終凝結(jié)為推動社會進步的力量。
也正如吳梅群所言:“這一行,有奔頭。”而這“奔頭”,正藏在每一位人工智能訓練師平凡卻不凡的日常里。(記者 何婉蓉)